首页> 外文OA文献 >Visual Question Answering: Datasets, Algorithms, and Future Challenges
【2h】

Visual Question Answering: Datasets, Algorithms, and Future Challenges

机译:视觉问题回答:数据集,算法和未来挑战

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Visual Question Answering (VQA) is a recent problem in computer vision andnatural language processing that has garnered a large amount of interest fromthe deep learning, computer vision, and natural language processingcommunities. In VQA, an algorithm needs to answer text-based questions aboutimages. Since the release of the first VQA dataset in 2014, additional datasetshave been released and many algorithms have been proposed. In this review, wecritically examine the current state of VQA in terms of problem formulation,existing datasets, evaluation metrics, and algorithms. In particular, wediscuss the limitations of current datasets with regard to their ability toproperly train and assess VQA algorithms. We then exhaustively review existingalgorithms for VQA. Finally, we discuss possible future directions for VQA andimage understanding research.
机译:视觉问答(VQA)是计算机视觉和自然语言处理中的最新问题,已经引起了深度学习,计算机视觉和自然语言处理社区的广泛关注。在VQA中,算法需要回答有关图像的基于文本的问题。自2014年发布第一个VQA数据集以来,已发布了其他数据集,并提出了许多算法。在这篇综述中,我们从问题的制定,现有的数据集,评估指标和算法方面严格审查了VQA的当前状态。特别是,我们讨论了当前数据集在正确训练和评估VQA算法方面的局限性。然后,我们详尽地审查VQA的现有算法。最后,我们讨论了VQA和图像理解研究的未来可能方向。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号